Random Forest_Ensemble Analysis

랜덤 포레스트(Random Forest)
랜덤 포레스트는 배깅과 유사하나 배깅에 더 많은 무작위성을 주는 분석 기법이다.

많은 무작위성으로 생성된 서로 다른 여러 개의 트리로 구성되어 있으며,
여러 개의 약한 트리들의 선형 결합으로 최종 결과를 얻는 모델이다.
install.packages(‘randomForest’)

> index<-sample(c(1, 2), nrow(iris) ,replace=T, prob=c(0.7, 0.3))

> index<-sample(c(1, 2), nrow(iris), replace=T, prob=c(0.7, 0.3))

> train<-iris[index==1, ]

> test<-iris[index==2, ]

> result<-randomForest(Species~., data=train, ntree=100)

> pred<-predict(result, newdata=test)

> table(condiction=test$Species, pred)

            pred

condiction   setosa versicolor virginica

  setosa         21          0         0

  versicolor      0          6         1

  virginica       0          2        14